Computo

Un journal en Statistique et Apprentissage promouvant la reproductibilité

https://github.com/computorg/RR2023
Colloque “Reproductibilité et Réplicabilité de la recherche: enjeux et propositions”

8 septembre 2023

Origine (2020)

La Société Française de Statistique missionne une cellule “publication”
(J. Chiquet puis P. Neuvial) pour proposer une nouvelle revue

Constat

Multiplication des journaux “traditionnels”

😔 dévalorisation des résultats négatifs

😥 peu/pas assez de valorisation du code et des études de cas

😱 ↓ de la qualité des publications et du temps consacré à un article

😱 ↓ de la reproductibilité scientifique (analyses, expériences)

Objectif: créer un journal qui répond à ces attentes

Computo en bref

Périmètre scientifique

Promouvoir les contributions en statistique computationnelle ou apprentissage statistique permettant d’évaluer la pertinence d’un modèle et des méthodes associées vis-à-vis d’une question scientifique spécifique

Un journal ouvert

  • Accès “diamant” (gratuité totale avec réutilisation possible)
  • Contenu publié sous licence CC-BY (crédit, modification)
  • Rapports de lecture et discussions disponibles après acceptation (relecteurs anonymes)

\(\rightsquigarrow\) En accord avec le Budapest Open Access Initiative (BOAI) and le Plan S

Un journal reproductible

  • La reproductibilité numérique des résultats est une condition nécessaire pour la publication
  • Codes et données doivent être disponibles: les codes sont pour partie exécutés et intégralement exécutables

Lancement officiel: fin 2021

Mise en place

  • Travail du futur comité éditorial
  • Outils de la communauté (Pandoc, Quarto, gitHub/gilab)
  • Soutiens Institutionnels (INRAE, INRIA, CNRS, SFdS)

Exemple

Fonctionnement (1/2)

Programmation littérale

Un document maître contenant:

  • texte (markdown)
  • équations (\(\LaTeX\))
  • code (Python/R/Julia) produisant résultats et illustrations

Fonctionnement (1/2)

Programmation littérale

Un document maître contenant:

  • texte (markdown)
  • équations (\(\LaTeX\))
  • code (Python/R/Julia) produisant résultats et illustrations

Fonctionnement (1/2)

Programmation littérale

Un document maître contenant:

  • texte (markdown)
  • équations (\(\LaTeX\))
  • code (Python/R/Julia) produisant résultats et illustrations

Fonctionnement (2/2)

Reproductibilité éditoriale

Compilation \(\Rightarrow\) article au format html et/ou pdf

Validation scientifique

  • OpenReview + base de relecteurs/relectrices
  • Rapports des relecteurs publiés après acceptation

Bilan à 20 mois d’exitence


🥲 Processus opérationnel + doi, ISSN

🙂 4 articles publiés, 4 en révision, 4 en relecture

🙂 Présentations (Montpellier, Toronto, Humastica, Grenoble, Rencontres R 2023)

🙂 Réseau français Science Reproductible

🤯 Difficulté à trouver des relecteurs


Éléments de discussion

Perspectives

  • Développement à l’international
  • Vers plus de reproductibilité: besoin de moyens de calculs
  • Passage de github à gitlab (institutionnel)

Question plus fondamentale: les “degrés de liberté du chercheur”

Autres initiatives pertinentes

Comité éditorial et support technique

Julien Chiquet (Éditeur en chef)

Apprentissage stat., DR INRAE
Université Paris-Saclay

Fra.-Dav. Collin, Ghislain Durif

Informatique Statistique, IR CNRS
IMAG Montpellier, ENS LYON

Pierre Neuvial

Statistique, DR CNRS
IMT Toulouse

Marie-Pierre Étienne

Statistique, MCF
AgroCampusOuest

Mathurin Massias

Optim./Machine-Learning
CR INRIA Lyon

Chloé Azencott

Machine Learning
CR MinesParisTech

Nelle Varoquaux

Machine learning, CR CNRS
Université Grenoble Alpes